کاربرد الگوریتم های داده کاوی در تشخیص داده های ژئوشیمیایی خارج از ردیف چند متغیره
نویسندگان
چکیده مقاله:
تشخیص دادههای خارج از ردیف چند متغیره به کمک الگوریتمهای دادهکاوی یکی از نکات ضروری پیشپردازش دادههای اکتشافات ژئوشیمیایی محسوب میشود. در این مقاله چهار الگوریتم برآورد چگالی کرنل (KDE)، ضریب خارج از ردیف بودن محلی (LOF)، OPTICS-OF و SVDD که به ترتیب جزو روشهای آماری، روشهای مبتنی بر مجاورت، روشهای مبتنی بر خوشهبندی و روشهای مبتنی بر دستهبندی هستند، معرفی شده و کاربرد آنها بر روی دادههای ژئوشیمیایی ورقه 100000/1 روم با ماتریس داده 41×902 بررسی شده است. برای این منظور ابتدا روش ilr برای باز کردن سیستم عددی دادهها بکار رفته و سپس دادهها در بازه صفر تا یک استاندارد شده است. نتایج پیاده شده چهار الگوریتم فوق بر روی مجموعه دادههای استاندارد شده، نشان میدهد که در رویکرد تشخیص نمونههای دارای خطا، 10 نمونه که دارای بالاترین احتمال خارج از ردیف بودن هستند و در هر چهار الگوریتم نیز یکسان میباشند را میتوان برای بررسی بیشتر به عنوان نمونههای انتخابی برای نمونهبرداری تکراری در نظر گرفت. در رویکرد تشخیص نمونههای غیر نرمال، از 150 نمونهی انتخابی 5/74% از نمونهها در هر چهار الگوریتم و 1/16% و 4/9% نیز به ترتیب در یک و دو الگوریتم به عنوان دادهی خارج از ردیف شناسایی شده است. مقایسه نتایج الگوریتمهای انتخابی با روش کلاسیک فاصله ماهالانوبیتس نشان دهندهی برتری آنها در هر دو رویکرد است. همچنین پیشنهادی میشود از الگوریتمهای تشخیص دادههای خارج از ردیف چند متغیره میتوان برای تعیین نمونه-برداریهای تکراری، محاسبه ماتریس موقعیت و پراکندگی در آمار چند متغیره مقاوم پس از حذف دادههای غیر نرمال و تعیین آنومالیهای ژئوشیمیایی استفاده کرد.
منابع مشابه
جداسازی داده های خارج از رده به روش تک متغیره و چند متغیره در داده های ژئوشیمی محدوده طلای اپی ترمال ساری گونای
دادههای پرت در ژئوشیمی اکتشافی بسیار مهم هستند و میتوانند اثرات زیادی بر نتایج روشهای آماری از جمله جداسازی آنومالی از زمینه داشته باشند. بنابراین یکی از اولین مراحل پیش پردازش در تحلیل دادههای ژئوشیمیایی، تشخیص و تصمیمگیری در مورد حذف یا تصحیح آنها است. این دادهها را به 3 روش تک متغیره، دو متغیره و چند متغیره میتوان شناسایی کرد که هدف از این تحقیق جداسازی آنها با استفاده از روشهای تک...
متن کاملآنالیز داده های ژل های الکتروفورز دو بعدی با استفاده از روش های آماری چند متغیره
سابقه و هدف : در سـال های اخیـر تکنولـوژی مـربوط به تـوصــیف لکه های پروتئینی نمایان شده بر ژل های الکتروفورز دو بعدی، توسعه ی قابل ملاحظه ای یافته و نرم افزارهای متعدد آماری آنالیز ژل نیز ایجاد و گسترش یافته است که تأثیر این ابتکارات بر ارتقاء پروتئومیک بسیار چشمگیر است.آنالیز داده های عظیم پروتئومیکی با دارا بودن متغیر های زیاد نیاز به روش های چند متغیره است که امکان آنالیز آماری همزمان چندین...
متن کاملداده کاوی و کاربرد آن در تصمیمگیریها
ابهامات محیطی ناشی از مدلهای نوین کسب و کار سبب تشدید پیچیدگی در تصمیمگیری، بهویژه در حوزه کسب و کار شده است. بهطوریکه بسیاری از متغیرهای تاثیرگذار ناشناخته بوده و روابط میان آنها نیز غیرخطی و پیچیده است. در چنین شرایطی دیگر نمیتوان دادهها را با ابزارهای سنتی تحلیل نموده و از آنها دانش استخراج کرد. از این روی مقاله حاضر به تشریح تکنولوژی داده کاوی در حوزه هوش محاسباتی و متدولوژی استا...
متن کاملجداسازی داده های خارج از رده به روش تک متغیره و چند متغیره در داده های ژئوشیمی محدوده طلای اپی ترمال ساری گونای
دادههای پرت در ژئوشیمی اکتشافی بسیار مهم هستند و میتوانند اثرات زیادی بر نتایج روشهای آماری از جمله جداسازی آنومالی از زمینه داشته باشند. بنابراین یکی از اولین مراحل پیش پردازش در تحلیل دادههای ژئوشیمیایی، تشخیص و تصمیمگیری در مورد حذف یا تصحیح آنها است. این دادهها را به 3 روش تک متغیره، دو متغیره و چند متغیره میتوان شناسایی کرد که هدف از این تحقیق جداسازی آنها با استفاده از روشهای تک...
متن کاملاستفاده از تکنیک های داده کاوی جهت تشخیص دیابت با استفاده از چربی خون
مقدمه: بیماری دیابت یکی از شایع ترین، خطرناک ترین و پرهزینه ترین بیماری های حال حاضر دنیا است که با نرخ هشدار دهنده ای در حال افزایش است. استفاده از روش های داده کاوی می تواند به تشخیص زودهنگام دیابت کمک کند که باعث جلوگیری از پیشرفت این بیماری و خیلی از عوارض آن مانند بیماری قلب و عروق، مشکلات بینایی و بیماری های کلیوی می شود. مواد و روش ها: در این تحقیق از نرم افزار داده کاوی رپیدماینر برای...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
عنوان ژورنال
دوره 14 شماره 45
صفحات 63- 82
تاریخ انتشار 2020-02-20
با دنبال کردن یک ژورنال هنگامی که شماره جدید این ژورنال منتشر می شود به شما از طریق ایمیل اطلاع داده می شود.
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023